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Appendix III: Alignment of intron A of M60321 with instant SEQ ID NO: 3 

BLASTN 2.2.25+ 

Reference: Zheng Zhang, Scott Schwartz, Lukas Wagner, and 
Webb Miller (2000), "A greedy algorithm for aligning DNA 
sequences", J Comput Biol 2000; 7 ( 1-2 ): 203-14 . 



RID: N069FRCK111 



Query= gi | 330624 | gb | M60321 . 1 | HS5MIEP Human cytomegalovirus major 
immediate-early protein gene, 5' end 

Length=2361 



Sequences producing significant alignments 
lcl 135151 SID_3 



Score E 
(Bits) Value 



ALIGNMENTS 
>lcl|35151 SID_3 
Length=3584 

Score = 630 bits (341), Expect = 0.0 
Identities = 349/353 (99%), Gaps = 1/353 (0%) 
Strand=Plus/Plus 



Query 1737 TCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGGCCAGACTTAGGCACAGCACAATGCCC 1796 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1010 TCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGGCCAGACTTAGGCACAGCACAATGCCC 1069 

Query 179 7 ACCACCACCAGTGTGCCGCACAAGGCCGTGGCGGTAGGGTATGTGTCTGAAAATGAGCTC 1856 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 10 70 ACCACCACCAGTGTGCCACACAAGGCCGWGGCGGTAGGGTATGTGTCTGAAAATGAGCTC 1129 

Query 1857 GGAGATTGGGCTCGCACCG-TGACGCAGATGGAAGACTTAAGGCAGCGGCAGAAGAAGAT 1915 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 113 0 GGAGATTGGGCTCGCACCGCTGACGCAGATGGAAGACTTAAGGCAGCGGCAGAAGAAGAT 1189 

Query 1916 GCAGGCAGCTGAGTTGTTGTATTCTGATAAGAGTCAGAGGTAACTCCCGTTGCGGTGCTG 19 75 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 119 0 GCAGGCAGCTGAGTTGTTGTATTCTGATAAGAGTCAGAGGTAACTCCCGTTGCGGTGCTG 12 49 

Query 19 76 TTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGCCGCGCGCGCCACCAGA 2 035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1250 TTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGCCGCGCGCGCCACCAGA 13 09 

Query 2036 CATAATAGCTGACAGACTAACAGACTGTTCCTTTCCATGGGTCTTTTCTGCAG 2088 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 1310 CATAATAGCTGACAGACTAACAGACTGTTCCTTTCCATGGGTTTTTTCTGCAG 1362 



Score = 449 bits (243), Expect = le-129 
Identities = 248/250 (99%), Gaps = 1/250 (0%) 
Strand=Plus/Plus 

Query 1265 GTAAGTACCGCCTATAGACTCTATAGGCACACCCCTTTGGCTCTTATGCATGCTATACTG 132 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 76 0 GTAAGTACCGCCTATAGACTCTATAGGCACACCCCTTTGGCTCTTATGCATGCTATACTG 819 
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Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



132 5 TTTTTGGCTTGGGGCCTATACACCCCCGCT-CCTTATGCTATAGGTGATGGTATAGCTTA 13 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
82 0 TTTTTGGCTTGGGGCCTATACACCCCCGCTTCCTTATGCTATAGGTGATGGTATAGCTTA 8 79 

13 8 4 GCCTATAGGTGTGGGTTATTGACCATTATTGACCACTCCCCTATTGGTGACGATACTTTC 14 43 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

8 8 0 GCCTATAGGTGTGGGTTATTGACCATTATTGACCACTCCCCTATTGGTGACGATACTTTC 939 

14 4 4 CATTACTAATCCATAACATGGCTCTTTGCCACAACTATCTCTATTGGCTATATGCCAATA 15 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

9 4 0 CATTACTAATCCATAACATGGCTCTTTGCCACAACTATCTCTATTGGCTATATGCCAATA 999 

1504 CTCTGTCCTT 1513 

I I I I I I I I I 
1000 CACTGTCCTT 1009 
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